DE eng

Search in the Catalogues and Directories

Hits 1 – 16 of 16

1
DiaCollo für GEI-Digital - Ein experimentelles Projekt zur weiteren Erschließung digitalisierter historischer Schulbuchbestände ...
BASE
Show details
2
DiaCollo für GEI-Digital - Ein experimentelles Projekt zur weiteren Erschließung digitalisierter historischer Schulbuchbestände ...
BASE
Show details
3
DiaCollo für GEI-Digital - Ein experimentelles Projekt zur weiteren Erschließung digitalisierter historischer Schulbuchbestände ...
BASE
Show details
4
DiaCollo für GEI-Digital - Ein experimentelles Projekt zur weiteren Erschließung digitalisierter historischer Schulbuchbestände ...
BASE
Show details
5
Recherchieren, Arbeiten und Publizieren im Deutschen Textarchiv: ein Praxisbericht
In: Zeitschrift für germanistische Linguistik. - Berlin [u.a.] : de Gruyter 46 (2018) 1, 147-161
BLLDB
Show details
6
Die Korpusplattform des "Digitalen Wörterbuchs der deutschen Sprache" (DWDS)
In: Zeitschrift für germanistische Linguistik. - Berlin [u.a.] : de Gruyter 45 (2017) 2, 327-344
BLLDB
Show details
7
Die Korpusplattform des „Digitalen Wörterbuchs der deutschen Sprache“ (DWDS)
In: ISSN: 0301-3294 ; EISSN: 1613-0626 ; Zeitschrift für Germanistische Linguistik ; https://hal.archives-ouvertes.fr/hal-01575661 ; Zeitschrift für Germanistische Linguistik, De Gruyter, 2017, Zeitschrift für Germanistische Linguistik, 45 (2), pp.327-344. ⟨10.1515/zgl-2017-0017⟩ ; https://www.degruyter.com/view/j/zfgl.2017.45.issue-2/zgl-2017-0017/zgl-2017-0017.xml (2017)
BASE
Show details
8
Deutsches Textarchiv (Dta) Und Clarin-D ...
BASE
Show details
9
Canonicalizing the Deutsches Textarchiv
Jurish, Bryan. - 2013
BASE
Show details
10
Constructing a canonicalized corpus of historical German by text alignment
In: New Methods in Historical Corpora (2013), 221-234
IDS Bibliografie zur deutschen Grammatik
Show details
11
Finite-state canonicalization techniques for historical German
Jurish, Bryan [Verfasser]; Staudacher, Peter [Akademischer Betreuer]. - Potsdam : Universitätsbibliothek der Universität Potsdam, 2012
DNB Subject Category Language
Online dissertations
Show details
12
Finite-state canonicalization techniques for historical German ; Endliche Techniken zur Kanonikalisierung historischen deutschen Textes
Jurish, Bryan. - 2012
Abstract: This work addresses issues in the automatic preprocessing of historical German input text for use by conventional natural language processing techniques. Conventional techniques cannot adequately account for historical input text due to conventional tools' reliance on a fixed application-specific lexicon keyed by contemporary orthographic surface form on the one hand, and the lack of consistent orthographic conventions in historical input text on the other. Historical spelling variation is treated here as an error-correction problem or "canonicalization" task: an attempt to automatically assign each (historical) input word a unique extant canonical cognate, thus allowing direct application-specific processing (tagging, parsing, etc.) of the returned canonical forms without need for any additional application-specific modifications. In the course of the work, various methods for automatic canonicalization are investigated and empirically evaluated, including conflation by phonetic identity, conflation by lemma instantiation heuristics, canonicalization by weighted finite-state rewrite cascade, and token-wise disambiguation by a dynamic Hidden Markov Model. ; Diese Arbeit behandelt Themen der automatischen Vorverarbeitung historischen deutschen Textes für die Weiterverarbeitung durch konventionelle computerlinguistische Techniken. Konventionelle Techniken können historischen Text wegen des hohen Grads an graphematischer Variation in solchem Text ohne eine solche Vorverarbeitung nicht zufriedenstellend behandeln. Variation in der historischen Rechtschreibung wird hier als Fehlerkorrekturproblem oder "Kanonikalisierungsaufgabe" behandelt: ein Versuch, jedem (historischen) Eingabewort eine eindeutige extante Äquivalente zuzuordnen; so können konventionelle Techniken ohne weitere Modifikation direkt auf den gelieferten kanonischen Formen arbeiten. Verschiedene Methoden zur automatischen Kanonikalisierung werden im Rahmen dieser Arbeit untersucht, unter anderem Konflation durch phonetische Identität, Konflation durch Lemma-Instanziierungsheuristiken, Kanonikalisierung durch eine Kaskade gewichteter endlicher Transduktoren, und Disambiguiierung von Konflationskandidaten durch ein dynamisches Hidden Markov Modell.
Keyword: ddc:400; Department Linguistik
URL: https://publishup.uni-potsdam.de/opus4-ubp/files/5562/jurish_diss.pdf
https://publishup.uni-potsdam.de/opus4-ubp/frontdoor/index/index/docId/5562
https://nbn-resolving.org/urn:nbn:de:kobv:517-opus-55789
BASE
Hide details
13
Finite-state canonicalization techniques for historical German
Jurish, Bryan [Verfasser]. - 2011
DNB Subject Category Language
Show details
14
Postmodern linguistics and the prospects of neural syntax: some polemical remarks
In: Theoretical linguistics. - Berlin [u.a.] : de Gruyter 37 (2011) 1-2, 37-44
BLLDB
OLC Linguistik
Show details
15
Finding canonical forms for historical German text
In: Text Resources and Lexical Knowledge. Selected Papers from the 9th Conference on Natural Language Processing KONVENS 2008 (2008), 27-38
IDS Bibliografie zur deutschen Grammatik
Show details
16Deutsches Textarchiv (DTA)
http://www.deutschestextarchiv.de/
Topic: Computational linguistics; History of language; Morphology; ...
Language: German, Standard
Forschungstyp: Research projects
Access: free access

Catalogues
0
0
1
0
2
0
0
Bibliographies
3
0
2
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
1
0
0
0
Open access documents
8
0
0
1
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern